Qwen-2.5 7B

mentions 1 type Person feed RSS

// recent coverage 1 mentions

02:16

2026-06-29

owls.baulab.info

large-language-models

Token Entanglement in Subliminal Learning

Researchers at Anthropic discovered that language models can transfer hidden behaviors through fine-tuning on seemingly meaningless data, a phenomenon called subliminal learning. They identified 'enta…

// co-occurs with top 1 entities

Anthropic 1